Epipola Geometry

송성근

2023년 12월 11일

우리는 앞서 camera calibration을 통해 3차원 물체를 2차원으로 변환하는 방법을 배웠어요. 그렇다면 반대로 2차원 이미지를 이용하여 3차원 물체로 변환하는 과정은 어떨까요? 모두가 알고 있듯, 하나의 이미지만으로는 2차원에서 3차원으로 복구하는 과정을 불가능해요. 차원이 줄어들어 모든 정보를 담을 수 없기 때문이죠.

그래서 우리는 다른 방법으로 여러 방향에서 촬영한 이미지들을 활용할 수 있겠어요. 이때 필요한 동일한 물체에 대한 서로 다른 지점에서의 이미지 쌍에 대한 기하학적 관계를 다루는 것이 Epipolar Geometry입니다.

용어 정리

먼저 기본적인 용어를 먼저 정리하고 가도록 하죠. 두 카메라의 원점을 연결한 선을 Baseline이라고 합니다. 그리고 이 baseline을 지나는 모든 평면을 epipolar plane라고 하죠. 이때 동일한 포인트

X

를 각 이미지에 투영한 포인트를 각각

x

x'

이라고 한다면,

X

x

x'

모두 동일한 epipolar plane위에 존재합니다.

Epipolar line

l

l'

은 epipolar plane과 이미지가 만나는 라인을 의미해요.

X

의 위치에 따라 계속해서 달라지죠.

Epipole

e

e'

은 baseline과 이미지가 만나는 지점이에요. 이는 상대 카메라의 중심이 내 이미지에 어디에 위치하는지를 나타내는 것이죠.

위 그림과 같이 같은 도자기를 찍은 두 사진이 있다고 하였을 때, epipole은 꼭 이미지 속에 있는 것이 아니에요.

위 사진도 마찬가지로, 스테레오와 같은 평행하게 한 물체를 찍었다면 epipole은 무한대가 되겟죠.

상대 카메라의 위치가 이미지 내에 있다면 이런 식으로 epipolar line이 이미지 내 카메라 위치로 모이는 것을 볼 수 있어요.

Epipolar constraint

동일한

X

를 촬영한 두 이미지를 봅시다. 좌측 이미지에서

x

라는 위치에 투영되었다고 할게요. 그렇다면 우측 이미지에서

X

에 해당하는

x'

은 epipolar line

l'

위 어딘가에 있을거에요. 그럼 우리는 한쪽 이미지에서 어떠한 feature를 다른 이미지에서 찾기 위해서 epipolar line위 점들만 조사하면 되는 거네요!

위 그림과 같이 좌측 카메라가 평면

\pi

를 이미지로 투영한 상태라고 합시다. 이 때

X

를 투영한 점을

x

, epipole을

e

라고 할게요.

l' = e' \times x' \tag{1}

3차원에서 두 점 p1과 p2를 지나는 직선의 방정식의 normal vector $l$ 은 $l = x_1 \times x_2$ 다.

우리는 epipolar line

l'

를 식 (1)과 같이 정의할 수 있어요. 이때

x

를

x'

로 변환하는 행렬

H_{\pi}

라고 하면

x' = H_{\pi}x \qquad l' = e' \times H_{\pi} x = F x \tag{2}

여기서

l'

은

x'

e'

을 지나는 직선의 방정식의 normal vector이고

x'

와 수직관계를 가지기 때문에

{x'}^T l' = 0

가 되죠.

e' \ times H_{\pi}

를 fundamental matrix

F

라고 합시다. 이를 식 (2)와 합쳐보면

{x'}^T F x = 0 \tag{3}

Properties of the fundamental matrix

Fundamental matrix

F

는 방향성을 가집니다.

또한 모든 epipolar line은 epipole을 지나갑니다.

사실 이 부분은 좀 이해가 안되는 부분이 많아서 추가로 조사를 해야 할듯!

Fundamental matrix estimation

즉

x

와

x'

쌍을 이용하여 식 (3)을 만족시키는

F

를 찾아야 해요.

F

는 homogeneous matrix이기 때문에 동일한 상수 배수로 scaling이 됩니다. 이로 인해 전체적인 scale 값은 중요하지 않으므로 하나의 파라미터 자유도를 가지게 돼요.

def(F) = 0

F

는 rank가 2입니다. 즉, 행렬의 두개의 행이 선형적으로 독립적이죠. 나머지 하나의 행은 다른 행의 선형 조합으로 표현될 수 있습니다. 이로 인해 추가로 하나의 파라미터 자유도를 가지게 돼요.

rank 2가 뭐지 이해가 안되어서 GPT 답변 가져왔음.
이 관계는  F가 에피폴라 선을 올바르게 나타내려면 계수가 2여야 함을 의미합니다.
왜냐하면, 계수가 3이면, 이는 F가 풀 랭크(full rank)를 가지고 있으며, 그 결과로 모든 점들이 대응 관계를 만족하지 않게 될 것이기 때문입니다.
반면, 계수가 1이거나 0이라면, 이는 F가 충분한 정보를 포함하지 않아 에피폴라 선을 올바르게 나타내지 못할 것임을 의미합니다.